Chuyển đổi các quan sát thô thành các cấu trúc đối tượng R là đường truyền kỹ thuật cần thiết cho phân tích xác suất. Trước khi mô hình hóa các phân phối, chúng ta phải thành thạo nhập dữ liệu và những khác biệt cấu trúc giữa các danh sách, ma trận và khung dữ liệu.
1. Nhập dữ liệu có cấu trúc
Nhập dữ liệu thông qua scan() thường yêu cầu một cấu trúc danh sách giả để định nghĩa kiểu biến (ví dụ, list(id="", x=0)). Điều này đảm bảo dữ liệu bên ngoài từ các tệp như input.dat được phân tích thành các thành phần dễ quản lý thay vì các vector phẳng.
2. Tổ chức theo chiều
Trong khi một ma trận được dùng cho các tập hợp số học đồng nhất (sử dụng byrow=TRUE), thì data.frame() là cầu nối chính thức cho mô hình hóa thống kê, cho phép các loại dữ liệu khác nhau tồn tại cùng nhau.
3. Khả năng truy cập biến
Truy cập dữ liệu để suy luận liên quan đến chỉ số thông qua inp[[1]] hoặc các cột được đặt tên như inp$id. Các hàm như attach() cho phép các biến trong toàn bộ đối tượng (ví dụ như eruptions) được truy cập trực tiếp mà không cần chỉ số lặp lại.